揭秘ChatGPT走红背后的独门云科技!
近期,微软宣布扩大与 OpenAI 的合作关系。微软 Azure 作为 OpenAI 的独家云服务提供商,自 2019 年开始便以其出色的、面向 AI 时代的领先架构,为 OpenAI 的快速发展提供助力。
微软将继续加大投入,支持 OpenAI 在人工智能领域的开创性研究,继续强化 Azure 作为 AI 基础设施的领先地位,帮助客户在全球打造并部署其 AI 应用。
微软已经正式发布上线 Azure OpenAI 服务,并将在多条产品线接入 OpenAI 模型。利用 Azure OpenAI 服务,Azure 全球版企业客户可以直接调用 OpenAI 模型,包括 GPT-3、Codex 和 DALL.E 模型,并享有 Azure 可信的企业级服务和为人工智能优化的基础设施。面向企业用户的 ChatGPT 也即将在全球版 Azure 上线。
「属于 AI 时代的云架构」
Azure 成为 OpenAI 独家云服务提供商
在 ChatGPT 上线之际,OpenAI CEO Sam Altman 发推特向 Azure 致谢——“Azure 打造了迄今最佳的 AI 基础设施”。技术界也因此开始好奇,这项从 2019 年开始的深度合作关系,究竟在资金投入与 Azure 算力支持之外,还有哪些不为外人知晓的共振?
关键词 1:超级计算
作为 OpenAI 独家云服务提供商,目前其包含 ChatGPT 在内的产品、API 接口服务及研发工作负载均由 Azure 提供。
对 OpenAI 而言,Azure 独特的架构设计至关重要。无论是研发阶段的模型训练集还是使用阶段的推理,正是 Azure 面向 AI 的架构赋予了 OpenAI 一流的性能和规模。
从 2016 年开始,微软就定下了将 Azure 打造成“面向世界的 AI 超级计算机”的愿景。而与 OpenAI 的持续、深入合作,则将云超级计算技术的前沿进一步向大规模、多 AI 超级计算系统的方向推进。
关键词 2:边做边学
只有“使用”,才会让 AI 更强大、更安全、更好用。
OpenAI 与微软的深度合作,以 Azure 作为其商用化的独家云服务提供商并授权 GPT-3 等系列模型,也有基于 Azure 迅速扩大用例规模的考量。目前 Azure 已经全线接入 OpenAI 能力。通过 Azure OpenAI 服务,企业和开发者可以基于 GPT-3、DALL·E 以及 Codex 打造自己的用例和产品。
微软于 2021 年 11 月推出了 Azure OpenAI 服务预览,使客户能够挖掘大规模生成 AI (large-scale generative AI) 模型的能力,同时满足企业客户对 Azure 云计算基础架构的期望——安全性、可靠性、合规性、数据隐私和内置的“负责任的 AI” (Responsible AI) 能力。
关键词 3:安全可信
无论是微软的负责任的 AI 原则,还是 OpenAI 的 AI Alignment 准则,指向的都是如何构建值得信赖和安全的 AI 系统和产品。我们也坦然接受,这是一个全新的产业领域。因此,更加需要业界各方的共同探索。Azure 与 OpenAI 在这一议题上,则是携手共进、引领探索的伙伴关系。
从「生成」到「对话」
ChatGPT 与微软的深度合作
ChatGPT 是 OpenAI 人工智能研究实验室推出的对话型消费者产品。在上线 2 个月时间里,ChatGPT 在全球快速积累了 1 亿月活跃用户,成为月活破亿速度最快的应用。
ChatGPT 快速走红同时,亦有不少技术爱好者从使用心得、架构分析、用例前景对 ChatGPT 展开深入讨论。就此,我们想从 OpenAI 深度合作伙伴的视角提供更多细节,帮助大家更全面地了解 ChatGPT。
关键词 1:生 成
恰如 GPT(Generative Pre-trained Transformer)之名,ChatGPT 核心是“生成”。在处理机器如何理解世界的议题上,OpenAI 所选择的“生成法”来自物理学家费曼的启迪——费曼认为若不能创造,便不算理解。(“What I cannot create, I do not understand.”)
所谓“生成法”,要言之,即是收集某一领域足够海量的数据,进而训练模型生成相似数据。我们认为,这一路径在自动理解数据集的特征方面,具有显著潜力。OpenAI 自 2016 年开始沿着这一路径探索机器思考的可能性。ChatGPT 即是在此基础上 3.5 版本模型的微调。
关键词 2:对 话
在生成模型的基础上,OpenAI 于2019 年完成了“一小步”——预测下一个单词。这即是 GPT-2。这一小步,OpenAI 及同年加入合作的微软,使用了一个包含 800 万网页的数据集及高达 15 亿的参数量。而人类在面临相同情境时,所需要的例子要少得多。由此而来的零样本学习(Zero-Shot)、小样本学习(Few-Shot)话题,OpenAI 则于 2020 年在 GPT-3 模型的相关研究中完成探索。由此,GPT 显得更“聪明”了。
另一个关键性跨越来自 InstructGPT 。为了让 GPT 更好地理解指令并给出更高质量反馈,OpenAI 与微软投入了大量资源,完成人类反馈强化学习(Reinforcement Learning from Human Feedback, RLHF)训练。要言之,RLHF 引入了人类 AI 训练师,以人类的喜好作为反馈信号。显然,这是一项投入极大且规模浩繁的工作。完成这项“修炼”的 GPT-3.5,才有了初步的“对话能力”。
关键词 3:负责任
确保中正、客观,是 OpenAI 自成立之日起就开始的追求。在 GPT-2 阶段,出于语料公正性考虑,OpenAI 甚至没有对外开放接口。
而在微软 2019 年加入合作以来,微软的“负责任的人工智能”原则,就在更深层次上影响着 GPT 发展。从训练数据开始,微软对数据集的公正性、安全性以及包容性就有严苛要求。在这样的技术伦理约束下,ChatGPT 才最终与各位相遇。
持续、快速的业务落地
Azure 助力企业挺进人工智能时代
近期,微软推出了由 ChatGPT 提供技术支持的新版必应搜索、Microsoft Edge 浏览器及高级 Teams 产品。在不久的将来,全球版企业用户将能通过 Azure OpenAI 服务快速访问 ChatGPT,以全新的方式创建应用,赋能创新。
随着 Azure OpenAI 服务的正式发布,更多用户可以基于微软 Azure(全球版)的企业级服务,访问包括 GPT-3、Codex 和 DALL·E 2 在内的更多人工智能基础设施:
Codex 基于 GPT-3 模型生成代码的自然语言描述,也可直接将自然语言指令翻译为代码片段
DALL•E 2 使用自然语言文本提示,生成逼真图像甚至是艺术作品
事实上,微软 Azure 本身已经拥有强大的认知服务。从图像、语音到搜索,在 GPT 自然语言指令的加持下,这些先进技术的使用,正在变得更便捷、更易于创新。
本文观点支持
周倩昀 Jane Zhou
微软数据与人工智能解决方案专家
点亮在看,给BUG点好看